AI资讯新闻榜单内容搜索-LLM

被Transformer光芒掩盖的论文，Meta科学家回顾十年前创新之作

这篇论文包含了当前 LLM 的许多要素，十年后的今天或许仍值得一读。

来自主题: AI技术研报

7855 点击 2025-05-02 15:32

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

现如今，微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。

来自主题: AI技术研报

7820 点击 2025-05-02 14:03

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

随着大语言模型 (LLM) 技术的迅猛发展，基于 LLM 的智能智能体在客户服务、内容创作、数据分析甚至医疗辅助等多个行业领域得到广泛应用。

来自主题: AI技术研报

7549 点击 2025-04-30 15:05

首个大模型全链路安全综述！南洋理工新国立等发布LLM Safety全景图：从数据、训练到部署的全面梳理

随着人工智能技术迅猛发展，大模型（如GPT-4、文心一言等）正逐步渗透至社会生活的各个领域，从医疗、教育到金融、政务，其影响力与日俱增。

来自主题: AI技术研报

8056 点击 2025-04-29 15:27

阶跃星辰开源图像编辑模型Step1X-Edit：一键改图大师，性能达到开源SOTA

阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit，性能达到开源 SOTA。该模型总参数量为 19B (7B MLLM + 12B DiT)，具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力；支持 11 类高频图像编辑任务类型，如文字替换、风格迁移、材质变换、人物修图等。

来自主题: AI资讯

8600 点击 2025-04-27 15:29

被《经验时代》刷屏之后，剑桥博士长文讲述RL破局之路

RL + LLM 升级之路的四层阶梯。

来自主题: AI技术研报

8198 点击 2025-04-24 18:21

连Claude 3.5都败下阵来，大语言模型能否定位软件服务的故障根因？

论文的第一作者是香港中文大学（深圳）数据科学学院三年级博士生徐俊杰龙，指导老师为香港中文大学（深圳）数据科学学院的贺品嘉教授和微软主管研究员何世林博士。贺品嘉老师团队的研究重点是软件工程、LLM for DevOps、大模型安全。

来自主题: AI技术研报

6220 点击 2025-04-22 17:58

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

RTP-LLM 是阿里巴巴大模型预测团队开发的高性能 LLM 推理加速引擎。它在阿里巴巴集团内广泛应用，支撑着淘宝、天猫、高德、饿了么等核心业务部门的大模型推理需求。在 RTP-LLM 上，我们实现了一个通用的投机采样框架，支持多种投机采样方法，能够帮助业务有效降低推理延迟以及提升吞吐。

来自主题: AI技术研报

6692 点击 2025-04-14 15:13

用 Agent 重塑生产力！揭秘扣子的史诗级三大更新，还有三个彩蛋！

LLM Agent 火了两年了，但业界仍然存在许多非共识。智能体数量卷上去了，概念炒上去了，但质量参差不齐，娱乐向的不好玩，提效向的不好用，具体企业落地更是各种大小问题不断。

来自主题: AI资讯

5379 点击 2025-04-10 09:41

从0到1玩转MCP：AI的「万能插头」，代码手把手教你！

在人工智能飞速发展的今天，LLM 的能力令人叹为观止，但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」，无法直接触及实时信息或外部工具。

来自主题: AI技术研报

8288 点击 2025-04-06 15:58

AI资讯新闻榜单内容搜索-LLM

被Transformer光芒掩盖的论文，Meta科学家回顾十年前创新之作

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

首个大模型全链路安全综述 ！南洋理工新国立等发布LLM Safety全景图：从数据、训练到部署的全面梳理

阶跃星辰开源图像编辑模型Step1X-Edit：一键改图大师，性能达到开源SOTA

被《经验时代》刷屏之后，剑桥博士长文讲述RL破局之路

连Claude 3.5都败下阵来，大语言模型能否定位软件服务的故障根因？

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

用 Agent 重塑生产力！揭秘扣子的史诗级三大更新，还有三个彩蛋！

从0到1玩转MCP：AI的「万能插头」，代码手把手教你！

首个大模型全链路安全综述！南洋理工新国立等发布LLM Safety全景图：从数据、训练到部署的全面梳理